
創投業者安德里森·霍羅威茨指出,視覺人工智慧正從直接生成像素圖像轉向生成程式碼,這項程式碼原生方法能大幅提升設計內容的編輯彈性與迭代效率,特別在介面設計與3D建模領域應用潛力巨大。
創投業者安德里森·霍羅威茨(Andreessen Horowitz)於週二(2日)指出,視覺人工智慧(AI)領域正迎來一項重大典範轉移。當前最受矚目的視覺AI工具已不再單純生成最終的像素圖像,而是轉向生成圖像背後的程式碼,這項轉變將大幅提升內容的編輯與迭代能力,提供像素原生模型無法比擬的精準回饋機制。
傳統的像素原生生成系統直接產生圖像或影片,擅長呈現紋理、氛圍、光影及真實感,例如用於生成電影鏡頭、情緒板或寫實照片時,擴散模型仍是主流方法。然而,這類系統在後續編輯方面存在限制,若圖像中某個細節不符合預期,使用者通常需要耗費更多時間進行修復或重新生成。
相較之下,程式碼原生生成系統則會產生一種結構化的程式碼表示,再由另一個引擎執行或渲染。這段程式碼可能是 SVG 檔案、HTML/CSS 佈局、React 元件、Lottie JSON 檔案、Blender 腳本、USD 場景圖、著色器或遊戲引擎場景。最終視覺輸出仍為像素,但其「真實來源」是一個可編輯、可重複使用、可版本控制的結構化程式碼。
這種轉變為設計工作流程帶來巨大效益。舉例而言,如果AI生成了一個點陣圖(raster image)的商標,而其中一個曲線不對,使用者需要手動遮罩、修復或重新繪製。但若輸出是 SVG 格式,使用者便能直接編輯路徑、原始圖形、漸層、筆觸或文字元素。在使用者介面(UI)設計方面,螢幕截圖僅能作為靈感,而HTML/CSS或React元件則能讓設計師檢查 DOM 結構、替換真實元件、測試響應式狀態,並整合至應用程式中。
程式碼原生生成更建立了精確的「程式碼→渲染→檢查→修改」反饋循環。模型能產生成品、渲染、找出問題,並修補來源碼。這種迭代過程的關鍵在於,每一次的修正都能改進基礎程式碼本身,而不僅是渲染出的視覺輸出。這意味著AI模型能在一個封閉且可驗證的環境中,除錯視覺程式,而非僅是重複取樣圖像。
目前,視覺程式碼生成的最主要應用集中於二維設計,特別是UI和圖形設計。然而,三維(3D)內容可能因此受益最多,因為3D資產不僅需要視覺上的正確性,更要求底層結構的一致性,包含幾何形狀、材質、零件層次與場景脈絡。透過 VIGA 等工具利用 Blender 作為渲染及反饋環境,能將視覺重建轉化為程式碼、渲染、檢查的循環。此外,Articraft3D 等軟體更直接將可動式3D生成視為編寫定義零件、幾何、關節與測試的程式。
Andreessen Horowitz 強調,若視覺程式碼生成模式奏效,成功產品的優勢將不只在於生成更精美的成果,而是在於能「掌握整個循環」:生成成品、渲染、找出問題、再修改來源碼。未來的渲染器將成為AI代理(agent)測試與改進工作的反饋環境,如同現今程式碼代理利用沙盒(sandbox)與虛擬機器(VM)一般。視覺AI正從單純的輸出,走向更具編輯性、可測試、可發布且可持續改進的程式碼成品。
